草庐IT

MySQL 文本或 VARCHAR

全部标签

python - lxml.tostring 错误地将文本替换为 HTML 实体

我目前正在从YAML文件中获取字符串并将其转换为XML。我正在使用lxml.etree这样做并且实际上是在构建一个XML标记对于我的YAML文件中的每个值,然后使用lxml.etree.tostring()将其写出.然而,给我的文件偶尔会有HTML标签,例如。,HTML实体,例如 ,以及喜欢的角色&.LXML解析器当前正在将所有这些转换为HTML实体,以便变成<a>和 变成&nbsp;和&简单地变成&.在前两种情况下,我似乎会丢失该数据,但我似乎无法弄清楚如何告诉LXML解析器不要为我进行任何HTML实体转换。有办法做到这一点吗?

xml - 如何执行 XSL 从 xml 标签中删除文本

我有一个像这样的XML:5kg2kg3kg2kg我想在其上应用XSL,以便标记需要转换为Weight并考虑唯一的数字。有了这个,我想添加一些输入XML中不存在的额外标记。如果的值只存在并且只有这样它才会显示KG其余的它将是空白的。预期输出:5KG2KG3KG2KG为此我申请了:KG请帮我找出我错的地方。 最佳答案 以下是满足您要求的通用解决方案。只有“权重”的节点需要处理或应用模板。然后您需要按照此处所述应用translate以仅提取字符串部分和数字部分。XPath-extractnumericvalueoutofstring为您演

xml - Groovy:Xml:如何在单个循环中读取已解析的 xml 字符串的文本

有一个xml字符串响应,其中包含一个名为的子标签,响应可能包含一个或多个标签如下,案例一字符串Xml=AkhilNikhilKiran案例二字符串Xml=AkhilStringparsedXml=newXmlParser(false,false).parseText(Xml)如果1值在第一个内标签是通过使用以下语句获得的Case1Stringname=parsedXml.Student.Name[0].text()案例2中的值在中标签是通过使用以下语句获得的Case2Stringname=parsedXml.Student.Name.text()那么我怎样才能得到valueAkhil即

XML 搜索——速度快,节点内的文本或文本作为属性值

不知道这是不是一个正确的问题,但出于好奇,我想知道哪个会被快速搜索。例如-John或我已经存储了数百万个文本作为属性值,尽管字符大小不够大。以上只是为了更好地理解这个问题的一个例子。现在如果使用XML数据库,如BaseX、eXists等,我尝试搜索或创建所有名称并为其建立索引,那么哪个会更快? 最佳答案 这是依赖于实现的,所以不能对所有XML数据库进行概括。虽然在这个简单的例子中,我猜它对所有数据库都是一样的:没关系。我将为BaseX解释这里会发生什么。假设您使用第一个结构并且想要获得元素。所以你使用像这样的XPath//A[Nam

xml - 使用 XSLT 拆分重复文本()并将非重复文本分组在一起

我有以下输入XML:12345我希望使用XSLT2.0对此进行转换,以拆分文本元素中的重复text()并将我的非重复项分组到单独的文件中(对于任意数量的重复项-我的示例只显示两个)。所以我的任何输出文件中都不应该有重复的text(),并且需要将它们分组到尽可能少的文件中。我上面的输出应该是这样的:document1.xml135document2.xml24我现有的XSLT代码段如下所示:我觉得我需要在我的for-each-group中收集重复项(以便按位置拆分),但显然这会导致每个元素一个文件:感谢您提供的任何帮助。提前致谢。 最佳答案

java - 使用 Java 的 XPath - 在子标签之间选择文本值

我正在处理这个html片段:<Prev 1 2 3 4 5 6 Next> 呈现(或多或少)为456Next>。我想选择“4”,因为我需要发现“当前”页面。使用//p[@class='pageSelector']/text()[normalize-space()](使用FirefoxXPathCkecker测试)我以为我已经解决了但没有,因为我获得了7个匹配项。谁能告诉我哪里错了?谢谢 最佳答案 normalize-space删除空格,但出于

python - 如何根据文本节点的值添加一个xml节点

我正在玩一个在@http://www.jsphylosvg.com/examples/source.php?example=2&t=xml找到的xml文件如果节点的值为name="Espresso",我想插入一个节点。例如我想更改为:Espresso2.0到:Espressowww.espresso.com2.0根据我迄今为止所做的研究,我可以使用xpath找到包含espresso的节点(这应该可行,但实际上不行?)importre,sysimportlxml.etreef=open("test.xml","r")data=f.read()tree=lxml.etree.XML(dat

Java XMLStreamReader,当文本包含START_ELEMENT时如何获取元素文本

如果我有一个XML元素,例如:thisisatitle使用XMLStreamReader.getElementText()很容易获取文本。但是,如果我遇到这样的元素,我无法弄清楚如何获取文本:thisisatitlewithanothertaginsideofit我什至不确定那是否是有效的XML,但它似乎通过了我试过的W3Cvalidator。根据theAPIdocs,如果您要在其中遇到另一个START_ELEMENT事件,则不能使用getElementText()获取文本。那么...您可以使用什么? 最佳答案 使用getTextg

xml - 在 XML 中混合文本和标签是否合法?

以下是可接受的XML结构吗?someinnertextsometextsometext2我想插入innertext()以及子节点到节点。这在XML中合法吗? 最佳答案 通常,除了子元素之外,您不必在标签中插入一些原始文本......请问您要做什么?无论如何你可以在这里验证它:http://www.w3schools.com/xml/xml_validator.asp到目前为止,您的文档中显然没有错误。 关于xml-在XML中混合文本和标签是否合法?,我们在StackOverflow上找到

c# - 应该如何在 XML 中解释带有 CDATA 和空格的文本节点?

System.Xml解析功能在商店中给我带来了一些惊喜,我想知道如何解释以下,或者这是否“取决于实现”:版本1:版本2:--应该什么是elem的值?或者这取决于解析它的实现是否可以,我应该只是处理那个?我预计(起初)在这两种情况下,开始/结束节点和第一个非空白字符之间的所有空白都将被忽略。事实并非如此,但如果做不到这一点,我至少希望它永远不会被忽略,但事实也并非如此。请参阅下面的完整重现以了解我的期望。详细说明...有两个案例让我在测试时难住了:XDocument.Parse在示例2中会突然开始包含\n\t空格,而在示例1中它会忽略它。XDocument.Load与newXmlRead